Google AI Mode: Powerful Search, Poor UsabilityGoogle AI 模式評測報告:搜尋能力強大,但可用性不足
AI Mode 功能介紹(What Is Google AI Mode?)
Google AI Mode 是一項結合傳統網頁搜尋廣度與大型語言模型(LLM)推理能力的搜尋功能。使用者可以透過自然語言提出問題,獲得綜合性的答案,並繼續追問補充問題,形成對話式資訊檢索過程。
該功能類似於 Perplexity AI,強調多媒體展示和資訊來源引用,使搜尋體驗更智慧、更完整。

AI 模式的優勢(Benefits of AI Mode)
1. 對話式結構 Conversational Format: Followup Prompts
允許使用者基於初步回答繼續提問;提供可點選的後續問題建議,便於探索相關內容;顯著區別於 Gemini 等其他 Google AI 工具的文字輸入建議形式。

2. 超級搜尋體驗 Supercharged Search
與傳統搜尋流程相比,AI Mode 能實現“搜尋自動化”和“結果整合”:
| 傳統搜尋流程 | AI 驅動搜尋流程 |
|---|---|
| 使用者構思關鍵詞並輸入 | 使用者以自然語言表達需求 |
| 搜尋引擎處理關鍵詞查詢 | LLM 自動生成多條子查詢 |
| 使用者手動瀏覽多個結果 | 系統自動整合查詢結果並返回總結 |
| 手動調整搜尋關鍵詞反覆嘗試 | 系統自動迭代、加深主題探索 |
此技術使用兩大核心方法:
- 查詢扇出(Query Fan-out): 將一個資訊需求擴充套件為多個子查詢;
- 增強檢索生成(RAG): 結合外部資料檢索後再生成回答,提升準確性。
例如,搜尋"奧克蘭最好的墨西哥美食"時,系統會自動執行多個子查詢(如"奧克蘭頂級墨西哥玉米捲餅店""奧克蘭優質墨西哥餐廳"),然後由 LLM 綜合結果並生成總結答案。本質上,AI 模式會解析使用者查詢,生成並執行多個相關搜尋,再整合資訊提供答案。

3. 整合 Google 生態系統
AI Mode 可呼叫 Google Maps、Shopping、YouTube 等產品的資料,如地圖評分、商品列表、影片等,極大增強搜尋結果的實用性與互動性。點選每個選項後,會展開一個互動式側面板,顯示詳細資訊,並提供使用者行程特定日期的價格報價。

研究方法(Our Study)
研究團隊觀察了 7 名使用者在自由探索任務中使用 AI Mode 的情況。參與者整體對 AI Mode 的資訊整合能力表示滿意,但也暴露出多項嚴重的可用性問題。
1.可發現性差(Poor Discoverability)
雖有多個入口(首頁搜尋框按鈕、搜尋結果頁新標籤、AI Overview 底部按鈕),但大多數使用者根本注意不到;
4 名參與者在研究前從未主動使用 AI Mode;可能是由於使用者已高度習慣傳統搜尋介面,對新元素直接忽略。

AI 模式有兩個入口:搜尋結果頁面的標籤,或者 AI 概述底部的按鈕。但要看到底部這個按鈕,使用者需要先展開 AI 概述,然後滾動到最底部(通常內容很長)。在我們的研究中,即使參與者展開了 AI 概述,也很少注意到這個按鈕。

2.功能名稱模糊且與其他 AI 產品混淆
Google 同時提供多個 AI 工具,使用者難以區分它們.使用者經常混淆這些功能,說明命名、定位與教育不足。
| 系統 | 型別 | 描述 |
|---|---|---|
| Gemini | 開放式 AI 聊天 | 獨立產品,可搜尋網路 |
| AI Mode | 搜尋內建 AI 聊天 | 針對搜尋場景最佳化的對話式工具 |
| AI Overview | AI 摘要功能 | 搜尋結果頁面自動顯示的 AI 生成總結 |
Gemini 是一個獨立的產品和通用人工智慧聊天機器人,可以訪問 Google 搜尋。

AI Mode 呈現為一個額外的搜尋選項,類似於影象或影片搜尋。

傳統的 Google 搜尋結果頁面可能會針對某些查詢包含人工智慧摘要。

3. 引導資訊缺失
歡迎頁提供的使用建議和示例提示,大多數參與者從未見過;使用者習慣從瀏覽器位址列直接搜尋,從而繞過了引導頁面。
AI 模式的首頁會給使用者一些使用提示,比如"問詳細一點,答案會更好"。但我們研究中的使用者都沒看到這些提示,因為他們直接跳過了這個頁面。如果使用者登入了 Google 賬號,系統還會根據他們最近搜尋過什麼來推薦相關問題。

4.回答過長且格式混亂
- 回應內容冗長,缺乏層次結構;
- 使用者往往略讀或跳過部分內容,甚至因此放棄 AI Mode;
- 建議:增加 加粗、標題、列表、摺疊段落 等格式改善可讀性。

5.長對話中的資訊查詢困難
對話越來越長後,很難找到之前的資訊。使用者無法快速回到之前的問題。建議增加:跳轉連結、對話目錄、歷史記錄等功能。
例如:一位使用者花了幾分鐘用 AI 模式找冰箱。她看到 LG 有個選項提到"ThinkQ 應用"。她覺得這個名字很奇怪,就問 AI 這是什麼。瞭解之後,她想回去看看剛才那臺 LG 冰箱。但她往上翻了很久都找不到,最後她想:要不直接讓 AI 再給一次連結算了。
6.頂部標籤導航與使用者預期不符
AI 模式顯示在頂部標籤欄裡,和影片、圖片、購物、地圖這些標籤放在一起。但其他標籤的作用是幫你篩選特定型別的內容,比如只看影片或只看圖片。AI 模式不一樣,它不是用來篩選結果的,而是用 AI 來回答你的問題。所以把它放在這裡,容易讓人搞混。

7. 幻覺問題(Hallucinations)仍存在
雖然引用來源增強可信度,但在冷門話題中仍會生成錯誤資訊;有一位參與者用 AI 模式找神經科學相關的研究論文。一開始覺得它找得挺好的。但他仔細一查,發現 AI 給出的那篇論文和作者根本不存在。專家使用者容易察覺,一般使用者可能無法辨別;建議:提高對來源準確性的檢測機制。